AI资讯新闻榜单内容搜索-DeepSeek

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSeek

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

DeepSeek V3.2的Agentic能力大增，离不开这项关键机制：Interleaved Thinking（交错思维链）。Interleaved Thinking风靡开源社区背后，离不开另一家中国公司的推动。

来自主题: AI技术研报

8062 点击 2025-12-04 14:58

老外傻眼！明用英文提问，DeepSeek依然坚持中文思考

老外傻眼！明用英文提问，DeepSeek依然坚持中文思考

老外傻眼！明用英文提问，DeepSeek依然坚持中文思考

就在前天，DeepSeek 一口气上新了两个新模型，DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

来自主题: AI技术研报

7962 点击 2025-12-04 11:37

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

8069 点击 2025-11-30 09:30

DeepSeek强势回归，开源IMO金牌级数学模型

DeepSeek强势回归，开源IMO金牌级数学模型

DeepSeek强势回归，开源IMO金牌级数学模型

就在刚刚，DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型：DeepSeek-Math-V2。顾名思义，这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时，这个模型只用 7B 参数量，就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO，显著提升了数学推理能力。

来自主题: AI资讯

8746 点击 2025-11-27 22:47

DeepSeek悄悄开源LPLB：用线性规划解决MoE负载不均

DeepSeek悄悄开源LPLB：用线性规划解决MoE负载不均

DeepSeek悄悄开源LPLB：用线性规划解决MoE负载不均

昨天，DeepSeek 在 GitHub 上线了一个新的代码库：LPLB。

来自主题: AI资讯

8248 点击 2025-11-21 10:50

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报

7784 点击 2025-11-21 09:16

速递｜日本AI独角兽Sakana AI，以26.5亿美元估值完成1.35亿美元B轮融资

速递｜日本AI独角兽Sakana AI，以26.5亿美元估值完成1.35亿美元B轮融资

速递｜日本AI独角兽Sakana AI，以26.5亿美元估值完成1.35亿美元B轮融资

当美国巨头如Google、OpenAI 和 Anthropic 竞相开发支撑其 AI 产品的大型语言模型时，Sakana AI、Mistral AI、DeepSeek 和 AI21 Labs 等初创公司正凭借为特定地区、行业或独特功能设计的专业模型开辟自己的细分市场。

来自主题: AI资讯

9168 点击 2025-11-18 16:35

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

近日，微博正式发布首个自研开源大模型VibeThinker，这个仅拥有15亿参数的“轻量级选手”，在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。

来自主题: AI资讯

7998 点击 2025-11-18 16:34

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

微调超大参数模型，现在的“打开方式”已经大变样了：仅需2-4 张消费级显卡（4090），就能在本地对DeepSeek 671B乃至Kimi K2 1TB这样的超大模型进行微调了。

来自主题: AI技术研报

7696 点击 2025-11-06 10:52

AI 时代，重新定义开发者丨最新白皮书解读

AI 时代，重新定义开发者丨最新白皮书解读

AI 时代，重新定义开发者丨最新白皮书解读

在 AI 时代，开发的边界正被重新划定。我们能够观察到，越来越多的产品经理、数据分析师、设计师，甚至内容创作者，正在熟练地使用 Cursor、ChatGPT、DeepSeek 等 AI 工具，解决真

来自主题: AI技术研报

9020 点击 2025-10-26 22:27

上一页当前第3页,共30页下一页